נוירון לינארי
- מדובר בנוירון אשר יודע לחשב סכום משוקלל של קלטים, כאשר:
- קלט (x): נתון מסוים המתקבל בנוירון, כלל הקלטים מיוצגים בוקטור
- משקל (w): החשיבות שיש לקלט מסוים, אינדקס המשקל תואם לאינדקס הקלט, כלל המשקלים מיוצגים בווקטור
- סכום משוקלל (y): תוצאה המתקבלת על ידי סכימת כפל כל קלט במשקל שלו.
דוגמא לנוירון בעל 2 קלטים ו-2 משקלים:
פונקציית שגיאה
- השגיאה היא ההפרש בריבוע בין הפלט הרצוי (
) למצוי (y) - השגיאה תהיה = 0 כאשר אין הבדל בין הפלט הרצוי והמצוי
- ההפרש (הסטייה) מועלת בריבוע כדי להעניש הפרשים גדולים יותר מאשר הפרשים קטנים, וכדי ליצור טווח חיובי
- פונקציית השגיאה בנוירון הלינארי היא השגיאה הריבועית הממוצעת על כל הדוגמאות
- המטרה היא למצוא את ערכי המשקלים אשר נותנים שגיאה מינימלית
נוסחאת השגיאה:
פתרון אנליטי לאימון הנוירון הלינארי
- בגלל שפונקציית השגיאה קמורה, אפשר למצוא את המינימום הגלובלי על ידי הפתרון הבא:
* נזכור כי:
מתי קיים פתרון יחיד לבעיית הרגרסיה הלינארית:
* תמיד קיים פתרון
* הפתרון יהיה יחיד אם ורק אם המטריה C הפיכה ( P x P)
* אם כמות הפרמטרים (P, עמודות) גדול מכמות הדוגמאות (N, שורות) הפתרון לא יהיה יחיד
* אם כמות הפרמטרים קטנה או שווה לכמות הדוגמאות, וגם העמודות של X תלויות לינארית, הפתרון לא יהיה יחיד.
פרמטר הטייה
- פרמטר הטייה מתנהג כקלט של מספר קבוע שהוספנו כדי לשפר את החישוב של הסכום המשוקלל
- כדי לשערך את פרמטר ההטייה, נוסיף עמודה של אחדים למטריצת הקלטים
דוגמא לאימון נוירון לינארי עם פרמטר הטייה:
הכללה
- יכלת ההלכה של נוירון היא היכולת של נוירון להתמודד עם דוגמאות חדשות בהינתן המשקלים שמצאנו
- ככל שיהיו לנו יותר דוגמאות אימון, צפוי כי ההכללה תהיה טובה יותר
- כאשר יש מעט מדי דוגמאות הנוירון לא יוכל להכליל
- לכן לרוב נעדיף (N >> P) כדי לקבל פתרון עם ביצועי הכללה טובים.
סוגי שגיאות
- שגיאת אימון: ממוצע השגיע על סט הדוגמאות שהוצגו לרשת.
- שגיאת המבחן: ממוצא השגיאה על סט דוגמאות שלא נכללו בסט האימון (אלא בסט המבחן)
- שגיאת הכללה: תוחלת השגיאה על כל הדוגמאות מהתפלגות מסוימת
ככלל, שגיאת ההכללה עבור סט המשקלים שהתקבלו מהאימון תקטן ככול שהיחס בין מספר דוגמאות האימון לבין מספר הפרמטרים גדל, עד שתשאף בקירוב לשגיאת הכללה אידיאלית. כך עבור שגיאת האימון שעולה (במקום לרדת) עד שתשאף בקירוב לשגיאת הכללה אידיאלית - נוסחאות: